许多机器学习问题在表格域中使用数据。对抗性示例可能对这些应用尤其有害。然而,现有关于对抗鲁棒性的作品主要集中在图像和文本域中的机器学习模型。我们认为,由于表格数据和图像或文本之间的差异,现有的威胁模型不适合表格域。这些模型没有捕获该成本比不可识别更重要,也不能使对手可以将不同的价值归因于通过部署不同的对手示例获得的效用。我们表明,由于这些差异,用于图像的攻击和防御方法和文本无法直接应用于表格设置。我们通过提出新的成本和公用事业感知的威胁模型来解决这些问题,该模型量身定制了针对表格域的攻击者的攻击者的约束。我们介绍了一个框架,使我们能够设计攻击和防御机制,从而导致模型免受成本或公用事业意识的对手的影响,例如,受到一定美元预算约束的对手。我们表明,我们的方法在与对应于对抗性示例具有经济和社会影响的应用相对应的三个表格数据集中有效。
translated by 谷歌翻译
对共同腐败的稳健性的文献表明对逆势培训是否可以提高这种环境的性能,没有达成共识。 First, we show that, when used with an appropriately selected perturbation radius, $\ell_p$ adversarial training can serve as a strong baseline against common corruptions improving both accuracy and calibration.然后,我们解释了为什么对抗性训练比具有简单高斯噪声的数据增强更好地表现,这被观察到是对共同腐败的有意义的基线。与此相关,我们确定了高斯增强过度适用于用于培训的特定标准偏差的$ \ sigma $ -oviting现象,这对培训具有显着不利影响的普通腐败精度。我们讨论如何缓解这一问题,然后如何通过学习的感知图像贴片相似度引入对抗性训练的有效放松来进一步增强$ \ ell_p $普发的培训。通过对CiFar-10和Imagenet-100的实验,我们表明我们的方法不仅改善了$ \ ell_p $普发的培训基线,而且还有累积的收益与Augmix,Deepaulment,Ant和Sin等数据增强方法,导致普通腐败的最先进的表现。我们的实验代码在HTTPS://github.com/tml-epfl/adv-training - 窗子上公开使用。
translated by 谷歌翻译
这项工作提出了一个新的对话数据集,即cookdial,该数据集促进了对任务知识了解的面向任务的对话系统的研究。该语料库包含260个以人类对任务为导向的对话框,其中代理给出了配方文档,指导用户烹饪菜肴。 Cookdial中的对话框展示了两个独特的功能:(i)对话流与支持文档之间的程序对齐; (ii)复杂的代理决策涉及分割长句子,解释硬说明并在对话框上下文中解决核心。此外,我们在假定的面向任务的对话框系统中确定了三个具有挑战性的(子)任务:(1)用户问题理解,(2)代理操作框架预测和(3)代理响应生成。对于这些任务中的每一个,我们都会开发一个神经基线模型,我们在cookdial数据集上进行了评估。我们公开发布烹饪数据集,包括对话框和食谱文档的丰富注释,以刺激对特定于域的文档接地对话框系统的进一步研究。
translated by 谷歌翻译
在本文中,我们报告了通过眼动的性别预测的第一个稳定结果。我们使用带有面部图像的数据集作为刺激和大量370名参与者。稳定性对我们有两种含义:首先,我们能够估计单个预测实验的标准偏差(SD)(约为4.1%);这是通过改变参与者人数来实现的。其次,我们能够提供具有非常低标准误差的平均准确性(SEM):我们的精度为65.2%,SEM为0.80%;这是通过许多随机选择预测的训练和测试集来实现的。我们的研究表明,两个特定的分类器达到了最佳精度:随机森林和逻辑回归。我们的结果重新确认了先前的发现,即女性对刺激的左眼更有偏见。
translated by 谷歌翻译
几项研究报告说,基于眼球运动特性的生物识别识别可用于认证。本文基于乔治和布线最初提出的方法的改进版本,通过跨多个数据集进行广泛研究用户识别。我们分析了对影响识别准确性的几个因素的方法,例如刺激类型,IVT参数(用于将轨迹分段为固定和扫视),添加新功能,例如眼球运动的高阶衍生物,包含眨眼信息,模板老化,年龄和性别。我们发现三种方法即选择最佳IVT参数,添加高阶导数特征,包括额外的眨眼分类器对识别准确性产生正影响。改进范围从几个百分点到一个数据集中的令人印象深刻的9%增加。
translated by 谷歌翻译
我们考虑文档级实体链接(EL)的任务,在该任务中,对实体的一致决定对整个文档进行共同提及很重要。我们旨在利用文档本身中提及的明确“连接”:我们建议将EL任务加入Coreference解决方案(CoreF)。这是对相关作品的补充,这些工作是利用(i)隐式文档信息(例如,实体提及或通用语言模型之间的潜在关系)或(ii)候选链接之间的联系(例如,从外部知识库中推断出)。具体而言,我们集群提及通过核心链接的,并为所有聚类提及的一个EL强制执行一个EL。后者的约束通过加入EL候选人名单来获得这样的群集提及,从而增加了覆盖范围的额外好处。我们将CoreF+EL问题提出为有向树的结构化预测任务,并使用全球标准化的模型来解决它。与独立对应物相比,两个数据集上的实验结果表明,CoreF和EL任务的提升高达 +5%F1得分。对于一部分硬案例,由于个人提及在其候选实体列表中缺乏正确的EL,我们的准确性提高了50%。
translated by 谷歌翻译
我们解决了现实世界用户生成的离散事件序列上的自我监督学习问题。自我监督的学习将来自原始数据的复杂信息包含在低维固定长度矢量表示中,这些信息可以轻松地应用于各种下游机器学习任务中。在本文中,我们提出了一种新方法“ COLES”,该方法将以前用于音频和计算机视觉域的对比度学习适应自我监督的设置中的离散事件序列域。我们根据大型欧洲金融服务公司的交易序列部署了COLES嵌入。 COLES嵌入的用法显着提高了预先存在的模型在下游任务上的性能,并产生了巨大的财务收益,每年以数亿美元的价格衡量。我们还在几个公共事件序列数据集上评估了COLES,并表明COLES表示在不同的下游任务上始终超过其他方法。
translated by 谷歌翻译